Hugging Face Tokenizers

huggingface Tokenizers 是一个开源项目,它提供了当今最常用的分词器的实现,重点关注性能和多功能性。这些分词器也被用于 Hugging Face 的 Transformers 库。

Hugging Face Tokenizers 的主要特点包括:

Hugging Face Tokenizers 还提供了对多种语言(更多即将推出!)的绑定,包括 Rust(原始实现)、Python、Node.js 和 Ruby

网络资源


本文作者:Maeiee

本文链接:Hugging Face Tokenizers

版权声明:如无特别声明,本文即为原创文章,版权归 Maeiee 所有,未经允许不得转载!


喜欢我文章的朋友请随缘打赏,鼓励我创作更多更好的作品!